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(54) Title: SERINE PROTEINASE INHIBITORS 

(54) Bezeichnung: SERIN-PR OTEINASE-INHIBITOREN 



(57) Abstract 



The invention relates to a serine proteinase inhibitor, characterised in that it has a domain with four cysteines, with a sequence of 13 
amino acids located between the first cysteine and the second cysteine, a sequence of 18 amino actds located between the second cysteine 
j and the third cysteine and a sequence of 2 amino acids located between the third cysteine and the fourth cysteine. The inventive serine 
i proteinase inhibitors can be used for treating inflammatory diseases such as acute or chronic cervical inflammations or tonsillitis, and for 
j preventing pulmonary emphysema. 

| (57) Zusammenfassung 

i 

j Serin-Proteinase-Inhibitor, dadurch gekennzeichnet, dass der Serin-Proteinase-Inhibitor eine Domane mit vier Cysteinen enthalt, 

! wobei sich zwischen dem ersten und zweiten Cystein eine Sequenz von 13 Aminosauren befindet, sich zwischen dem zweiten und dritten 
j Cystein eine Sequenz von 18 Aminosauren befindet und sich zwischen dem dritten und vierter Cystein eine Sequenz von 2 Aminosauren 
. benndet. Die Serin-Proteinase-Inhibitoren kdnnen fill* die Behandhmg entzundlicher Erkrankungen wie z.B. akuter oder chronischer 
Cervixentzundungen oder Tonsillitis verwandt werden sowie fiir die Prophylaxe der Lungenemphysembildung. 
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Serin -Proteinase- Inhibit or en 

Die Erfindung betrifft Serin-Proteinase- Inhibitoren, cDNA 
kodierend fur Serin-Proteinase- Inhibitoren, Arzneimittel 
enthaltend die Inhibitoren oder deren codierende Nuclein- 
saure, Verwendungen der erf indungsgemaSen Verbindungen zur 
Herstellung von Arzneimitteln zur Behandlung verschiedener 
Indikationen, Antikorper oder Ant ikorperf ragmente gegen 
Epitope der erf indungsgemaSen Verbindungen, Poly- oder 
Oligonucleotide, die rnit Genen der erf indungsgemaSen Ver- 
bindungen hybridisieren, ein Diagnostikum zum Aufspiiren der 
erf indungsgemaSen Verbindungen, sowie Arzneimittel enthaltend 
Antikorper oder Poly- oder Oligonucleotide gemaS der Er- 
findung . 

Proteolytische Prozesse spielen in alien Organismen eine 
bedeutende physiologische Rolle, wobei zwischen un- 
spezif ischen und spezif ischen proteolyt ischen Reaktionen zu 
unterscheiden ist. Zu den ersten gehoren beispielsweise der 
Nahrungsauf schluS im Verdauungst rakt durch Endopept idasen 
scwie der intrazellulare Abbau verbrauchter endogener 
Substanzen und phagozyt ierten Materials durch lysosomale 
Proteinasen . Spezif ische Proteolysen dienen meiscens der 
Uberfiihrung eines Proenzyme in die aktive Form wie bei dez~ 
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Uberfuhrung von Trypsinogen in Trypsin unci Chymot rypsinogen 
in Chymotrypsin sowie bei den Kallikrein-Kinin-Kaskaden und 
der Blutgerinnungskaskade . Je nach Beschaf f enheit des re- 
aktiven Zentrums der daran beteiligten Proteinasen werden 
diese in die Klassen der Serin-Proteinasen (z.B. Chymo- 
trypsin, Trypsin, Elastase und Kathepsin G) , der Aspartat- 
Proteinasen (z.B. Kathepsin D, Kathepsin E und Pepsin), der 
Cystein-Proteinasen (z.B. Kathepsin B, Kathepsin H und 
Kathepsin L) und der Metallo-Proteinasen (z.B. Kollagenase 
und Thermolysin) unterteilt. 

Urn die oft kaskadenartig verlaufenden proteolyt ischen 
Prozesse gegenregulieren zu konnen, verfugt der Organismus 
uber eine Reihe von anderen Proteinen, den Proteinase- Inhibi- 
toren (zur Ubersicht siehe Laskowski und Kato, 1980 und Bode 
und Huber, 1992). So schiitzen die in der Leber syntheti- 
sierten, humanen Plasma-Proteinase-Inhibitoren c^-Aritichymo- 
trypsin und ^-Proteinase- Inhibitoren das Lungengewebe vor 
unspezif ischem Angriff durch die Proteinasen Kathepsin G bzw. 
Elastase aus polymorphkernigen Lymphozyten . Bei einem Un- 
gleichgewicht zwischen Proteinasen und ihren spezifischen 
Inhibitoren kann es zum Auftreten pathologischer Effekte 
kommen . Ein ubermaEiges Verhaltnis von Elastase zu a x - 
Proteinase-Inhibitor erhdht beispielsweise bei Patienten mit 
genetisch bedingtem Mangel an diesem Faktor das Risiko der 
Bildung eines Lungenemphysems urn ca . 20 bis 30fach gegeniiber 
der Normalbevolkerung (Carrel und Owen, 1980) . Bei Rauchern 
wird die Emphysembildung mittels Oxidation der im reaktiven 
Zentrum des ^-Proteinase- Inhibitors befindlichen Amino saure 
Methionin durch im Zigarettenrauch enthaltene Oxidantien 
begiinstigt (Miller und Kuschner, 1969; Ohisson et al . , 1980) . 
Auch im Falle der Infektion mit Gram-negat iven Bakterien 
konnen deren Endotoxine eine Desintegra: ion von Phagozyten 
und damit die Ausschiittung lysosomaler Proteinasen verur- 
sachen, was durch den erhohten Verbrauch an Proteinase- 
Inhibitoren unkontrollierte Gewebsschadigung und Entziindungen 
verursachen kann. Aus diesem Grund besitzen bestimmte 
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Proteinase- Inhibitoren ein hohes therapeut isches Pocential 
(siehe z.B. Fritz, 1980). 



Das der Erfindung zugrunde liegende technische Problem 
besteht darin, weitere Inhibitoren von Serin-Proteinasen zur 
Verfugung zu stellen. Des weitererj sollten die fur die 
erf indungsgemaEen Inhibitoren kodierenden Gene bzw. cDNA zur 
Verfugung gestellt werden. 

Spezifisches Merkmai der erf indungsgemaSen Serin-Proteinase- 
Inhibitoren ist, daS der Serin-Proteinase-Inhibitor eine 
Domane mit vier Cysteinen aufweist und sich zwischen dem 
ersten und einem zweiten Cystein eine Sequenz von 0 bis 20 
Aminosauren befindet oder der Serin-Proteinase- Inhibitor eine 
Domane mit sechs Cysteinen aufweist und sich zwischen dem 
ersten und zweiten Cystein eine Sequenz von. 7 bis 20 Amino- 
sauren befindet. 

Bevorzugterweise befindet sich zwischen einem ersten und 
einem zweiten Cystein eine Sequenz von 13 Aminosauren 
und/oder zwischen einem zweiten und einem dritten Cystein 
eine Sequenz von 18 Aminosauren und/oder zwischen einem 
dritten und vierten Cystein eine Sequenz von 2 Aminosauren. 



Es wird insbesondere bevorzugt, daS die Sequenz zwischen 
einem ersten und zweiten Cystein ausgewahlt wird aus 



HEFQAFMKNGKLF, 
DDFKKGERDGDFI , 
SAFRPFVRNGRLG, 
KEYEKQVRNGRLF , 
SQYQNQAKNGILF, 
NEYRKLVRNGKLA, 



SEYRKSRKNGRLF, 
SEFRDQVRNGTLI , 
SEYRHYVRNGRLP , 
DEFRRLLQNGKLF, 
AEYREQMKNGRLS oder 
DEFRSQMKNGKLI 



und/oder die Sequenz zwischen einem zweiten und dritten 
Cystein ausgewahlt wird aus 
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PQDKKFFQSLDGIMFINK , 



TRENDP IQGPDGKMHGNT, 
TREHNPVRGPDGKMHGNK, 
TRENDP I EGLDGKI HGNT , 
TREND PVRGPDGKTHGNK , 



TRENDPVLGPDGKTHGNK , 



TRESDPVRGPDGRMHGNK , 



TRENDPIRGPDGKMHGNL, 



TRENDP I QGPDGKVHGNT , 



TRE S D P VRD ADGKS YNNQ oder 



TRESDPVRGPDGKTHGNK 



und/oder die Sequenz zwischen ..einern dritten und vierten 
Cystein ausgewahlt wird aus 

AT , AL, AM, SM oder I'M . 

Besonders bevorzugt wird, daft der erf indungsgemafte Serin- 
Proteinase- Inhibitor einer der Formeln 





-c 


-HEFQAFMKNGKLF- 


■C- 


- PQDKKFFQSLDGIMFINK - 


■C 


-AT- 


■C- 


■R 3 


Ri 


-c 


-DDFKKGERDGDFI - 


■c- 


- PD YYEAVCGTDGKTYDNR - 


c 


-AL- 


O 


■R 2 


Ri 


-c 


- SAFRPFVRNGRLG- 


■c- 


- TRENDPVLGPDGKTHGNK - 


■c- 
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c- 


R 2 


Rx 


-c 


- KE YEKQVRNGRLF - 


■c- 


- TRESDPVRGPDGRMHGNK - 


c- 


-AL- 


c- 


R 2 


Ri 
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-SQYQNQAKNGILF- 
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■R 2 


Ri 


-c- 


- NE YRKLVRNGKLA - 


c- 


■ TRENDP I QGPDGKVHGNT - 


■c- 


-SM- 


c- 


■R 2 


Ri 


-c- 


- S EYRKSRKNGRLF - 


c- 


■ TRENDP I QGPDGKMHGNT - 


c- 


-SM- 


c- 


R 2 


Ri 


-c- 


- S E FRDQ VRNGTL I - 


c- 


• TREHNPVRGPDGKMHGNK - 


c - 


-AM- 


■c- 


R 2 


Ri 


-c- 


- SEYRHYVRNGRLP - 


■c- 


TREND P I EGLDGK I HGNT - 


c 


-SM- 


c- 


R 2 


Ri 


-c- 


- DEFRRLLQNGKLF - 


c- 


•TREND PVRGPDGKTHGNK - 


■c- 


-AM- 


c- 


R 2 


Ri 


-c- 


- AE YREQMKNGRLS - 


c- 
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worin R x NH 2 , eine Aminosaure oder ein Pepcid rnit bis zu 100 
Aminosauren ist und R 2 COOH, C0NH 2/ eine Aminosaure oder ein 
Peptid mit bis zu 100 Aminosauren ist, entspricht. 

Es ist weiterhin bevorzugt, daft die Serin-Proteinase ein oder 
mehrere Disulf idbriicken auf weist . Dabei ist besonders bevor- 
zugt, daft er zwischen dem ersten und vierten Cystein und/oder 
dem zweiten und dritten Cystein eine Disulf idbriicke aufweist 
oder daft er zwischen dem ersten und fiinften Cystein und/oder 
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dem zweiten und vierten Cystein und/oder dem dritten und 
sechsten Cystein eine Disulf idbriicke aufweist. 

Bevorzugte Vertreter der erf indungsgemaSen Serin- Proteinase - 
Inhibitoren sind die Verbindungen HF 6479 und HF 7665 sowie 
Fragments der Proteine VAKTI-1 und VAKTI-2 gemaS den Figuren 
1 und 2 . 

Aus den Figuren 1 bis 3 iassen sich neben der Aminosaurese- 
quenz der erf indungsgemaS bevorzugten Verbindungen auch 
weitere Inf ormat ionen beziiglich der cDNA, die fur die er- 
f indungsgemaSen Verbindungen kodiert, entnehmen . Insbesondere 
werden die entsprechenden Motive und Primer hybridisierenden 
Stellen angegeben. 

Die erf indungsgemaSe Verbindung HF 3479 weist eine Masse von 
6.479 Dal ton auf, diejenige von HF 7665 betragt 7.665 Dal ton, 
beide wurden aus Hamofiltrat auf gereinigt . 

Erf indungsgemaS beansprucht wird auch eine cDNA, kodierend 
fur die erf indungsgemaSen Verbindungen, insbesondere eine 
cDNA mit der Nucleinsauresequenz gemaS Figuren 1 bis 2 . 

Die erf indungsgemaSen Verbindungen sind als Arzneimittel 
geeignet. Gegebenenf alls werden sie zusammen mit pharma- 
zeutisch vertraglichen Tragerstof f en appliziert. 

Die erf indungsgemaSen Arzneimittel enthaltend die erf indungs- 
gemaSen Proteinase- Inhibitoren werden vorzugsv/eise in Mengen 
von 1 bis 100 mg/kg Korpergewicht des Patienten verabreicht . 
Als Verabreichungsf orm kommen alle galenischen Zubereitungen 
fur Pept idwirkstof f e in Frage . Die Arzneimittel enthaltend 
Nucleinsauren gemaS der Erfindung werden vorzugsweise in 
Mengen von 0,1 bis 100 mg/kg Korpergewicht eines entsprechen- 
den Patienten verabreicht. Hier kommen als galenische Ver- 
abreichungsf ormen solehe in Betracht, die zur Applikation 
von Nucleinsauren geeignet sind, ohne daS die Nucleinsauren 
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vor Erreichen des Wirkortes durch Stof f wechseleinf lusse 
unwirksam gemacht werden. Als galenische Verabreichungsf orm 
konnen z.B. Liposomen eingesetzt werden, in denen die 
Nucleinsauren befindlich sind. 

Die erf indungsgemaSen Verbindungen kommen insbesondere zur 

i 

Behandlung von akuten oder chronischen Cervixentzundungen, 
Entziindungen der Bartholinschen Driisen oder anderer vaginaler 
Bereiche, Tonsillitis, Pharyngitis und Laryngitis, mit exzes- 
siver Schleimbildung verbundener akut oder chronisch entzund- 
licher Prozesse und sich daraus ergebender akuter Not- 
situationen, postoperativer Blutungen aufgrund Hyper- 
fibrinolyse sowie zur Prophylaxe der Lungenemphysembildung 
bei Q^-Proteinase-Inhibitormangel in Betracht . 

Die erf indungsgemaisen Verbindungen konnen bei Mangel an 
Serin-Proteinase-Inhibitoren verabreicht werden, urn endogene 
Defizite auszugleichen . Die Nucleinsauren konnen, direkt oder 
an geeignete Vehikel gekoppelt, auch zum Einsatz in der 
Gentherapie gelangen. Als geeignete Vektoren kommen ins- 
besondere attenuierte Adenoviren, in die entsprechenden Gene 
inkorporiert werden, in Frage . 

Die erf indungsgemaSen Polypeptide, insbesondere VAKTI-I und 
VAKTI-II, konnen zur Herstellung von Antikorpern oder Anti- 
korperf ragmenten dienen. Diese werden in einfacher Weise 
durch Immunisierung geeigneter Sauger hergestellt. Durch an 
sich bekannte Operationen konnen die Antikorper auch humani- 
siert werden, so daS diese Antikorper ebenfalls zum thera- 
peutischen Einsatz gelangen konnen. Antikorper oder Anti- 
korperf ragmente konnen dann zur Regulation von Erkrankungen 
eingesetzt werden, bei denen die Proteinase- Inhibitoren 
pathologisch exprimiert werden. Ebenso konnen zu den er- 
f indungsgemaisen Nucleinsauren komplement are An t i sense - 
Nucleinsauren zum therapeutischen Einsatz bei Uberexpression 
cer Proteinase- Inhibi tor-Genen eingesetzt werden. 
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Die erf indungsgemaSen Verbindungen sind in einfacher Weise 
durch an sich bekannte Methoden der Peptid- bzw. Nucleotid- 
synthese herstellbar. Einer gentechnischen Herstellung der 
Verbindungen stent ebenfalls nichts im Wege. 

Der Fachmann erkennt, daS bei den Polypeptiden gemaS der 
Erfindung auch Fragment e verwendet werden konnen, sofern sie 
die inhibitorischen Eigenschaf ten der Serin-Proteinase- 
Inhibitoren beibehalten. Das Auffinden solcher Fragmente ist 
dem Fachmann bekannt . So erfolgt dies beispielsweise durch 
gezielte enzymacische Spaltung der erf indungsgemaSen Ver- 
bindungen. Es konnen auch in den Seitenketten modif izierte 
Aminosauren eingesetzt werden. Auch N- und C- terminal modifi- 
zierte Polypeptide kommen in Betracht. Insbesondere konnen 
phosphorylierte, glycosylierte , methylierte, acetylierte oder 
in ahnlicher Weise modifizierte Polypeptide eingesetzt 
werden, sofern sie die Wirkung der Serin-Proteinase- In- 
hibitoren nicht relevant beeintracht igen . 

Bei den Nucleinsauren gemaS der Erfindung kommen auch 
Derivate in Betracht, die je nach Codon Usage modifizierte 
Tripletstrukturen aufweisen. Desweiteren sind als Nuclein- 
sauren gemaS der Erfindung auch solche zu verstehen, die 
durch Nucleasen gegeniiber den nativen Verbindungen weniger 
stark abgebaut werden, beispielsweise die ent sprechenden 
SODN-Derivate , die in der Antisense-Technologie iiblicherweise 
eingesetzt werden, urn die Antisense-Strukturen gegeniiber 
enzymatischen Angriffen stabiler auszugestal ten . 

Auch mit den Polypeptiden homologe Strukcuren kommen in Be- 
cracht. Dies sind insbesondere Polypeptidstrukturen , bei 
denen Aminosauren ausgetauscht sind. So konnen beispielsweise 
konservative Aminosauresubs t i tut ionen in hochkonservierten 
Regionen wie folgt berucksicht igt werden: Jede Isoleucin-, 
Valin- und Leucin- Aminosaure kann gegen eine andere dieser 
Aminosauren ausgecauscht sein, Aspartat kann gegen Giutamat 
und umgekehrt ausgetauscht sein, Glutamin gegen Asparagin 



4 
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und umgekehrt , Serin gegen Trionin und umgekehrt . {Con- 
servative Aminosauresubstitut ionen in weniger hochkonser- 
vierten Regionen konnen wie folgt sein: Jede der Aminosauren 
Isoleucin, Valin und Leucin gegen jede andere Aminosauren, 
Aspartat gegen Glutamat und umgekehrt, Glutamin gegen 
Asparagin und umgekehrt, Serin gegen ( Theonin und umgekehrt, 
Glycin gegen Alanin und umgekehrt, Alanin gegen Valin und 
umgekehrt, Methionin gegen jede der Aminosauren Leucin, 
Isoleucin oder Valin, Lysin gegen Arginin und umgekehrt, eine 
der Aminosauren Aspartat oder Glutamat gegen eine der Amino- 
sauren Arginin oder Lysin, Histidin gegen eine der Amino- 
sauren Arginin oder Lysin, Glutamin gegen Glutamat und 
umgekehrt und Asparagin gegen Aspartat und umgekehrt . 

Die Wirkungsweise der erf indungsgemaSen Peptide wird durch 
das f olgende Beispiel erlautert . 

Beispiel 

Messung der Proteinase Inhibition durch HF 7665 
MeSansatz : 



Die Reaktion wurde durch Zugabe des chromogenen Substrates 
gestartet und der Substratumsat z mittels Photometer bei X= 
405 nm verf olgt . Nach ca. fiinf Minuten wurden 10 jil Pro- 
teinase- Inhibitor b2w. entsprechende Kontrollen dazugegeben 
und der weitere Ext inkt ionsverlauf beobachtet . 



10 ill 



84 ill 
1 ill 
5 M l 



MeEpuffer (0,1 M HEPES, pH 7.5; 0,5 M NaCl 2 ) 
Trypsin (1 rag/ml in 1 mM HCl, 20 mM CaCl 2 ) 
L-BABNA (6 mg/ml Na-Benzoyl -L-Arginine -p-Ni tro- 
anilide Hydrochloride) 

Proteinase-Inhibitor (10 jiM bzw. 75 /ig/ml HF 7665 
in H 2 0) . 
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Es konnte gezeigt werden, daS HF 7665 in einer Endkonzen- 
tration von ca . 1 fxM bzw. 7,5 /ig/ml einen inhibitor ischen 
Effekt auf Trypsin besitzt. Kontrollversuche mit entsprechen- 
den Mengen an BSA (7,5 jig /ml) und Acetoni tril/TFA (0,8% 
ACN/0,001% TFA) zeigten keine Trypsininhibierung. Weiterhin 
konnte kein inhibi torischer Effekt von HF 7665 auf Chymo- 
trypsin bei einem ahniichen Test bedbachtet werden. 

Figur 3 zeigt, da& sich nach Zugabe von HF 766 5 der 
Substratumsatz durch Trypsininhibierung um ca . 30% ver- 
mindert . 
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Anspriiche 



1. Serin-Proteinase-Inhibitor , dadurch gekennzeichnet , daS 
der Serin-Proteinase- Inhibitor eine Domane mit vier 
Cysteinen aufweist und sich zwischen dem ersten und 
zweiten Cystein der Domane eine Sequenz von 13 Amino- 
sauren, zwischen dem zweiten und dritten Cystein der 
Domane eine Sequenz von 18 Aminosauren und zwischen dem 
dritten und vierten Cystein der Domane eine Sequenz von 
2 Aminosauren befindet. 



Serin-Proteinase- Inhibitor- gemaS Anspruch 1, dadurch 
gekennzeichnet, da£ die Sequenz der Domane zwischen dem 
ersten und dem zweiten Cystein ausgewahlt wird aus 

HEFQAFMKNGKLF , SEYRKSRKNGRLF , 

DDFKKGERDGDFI , SEFRDQVRNGTLI , 

SAFRPFVRNGRLG , SEYRHYVRNGRLP , 

KEYEKQVRNGRLF , DEFRRLLQNGKLF , 

SQYQNQAKNGILF, AEYREQMKNGRLS oder 

NEYRKLVRNGKLA, DEFRSQMKNGKLI . 



3. Serin-Proteinase-Inhibitor gemaS einem der Anspriiche 
1 und/oder 2, dadurch gekennzeichnet, daS die Sequenz 
zwischen dem zweiten und dem dritten Cystein der Domane 
ausgewahlt wird aus 



PQDKKFFQSLDGIMFINK, 
TREND PVLGPDGKTHGNK , 
TRESDPVRGPDGRMHGNK , 
TREND P I RGPDGKMHGNL , 
TRENDP I QGPDGKVHGNT , 
TRESDPVRGPDGKTHGNK . 



TRENDP IQGPDGKMHGNT , 
TREHNPVRG PDGKMHGNK , 
TRENDPIEGLDGKIHGNT , 
TRENDP VRGPDGKTHGNK , 
TRESDPVRDADGKSYNNQ oder 



4 



Serin-Proteinase-lnhibitor gernaS einem der Anspriiche 
1 bis 3, dadurch gekennzeichnet,. daB die Sequenz 
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zwischen dem dritten und dem vierten Cystein der Domane 
ausgewahlt wird aus 

AT, AL # AM, SM Oder TM. 

5. Serin- Proteinase- Inhibitor gemaS einem der Anspriiche 

i 

1 bis 4, mit einer der Formeln 

R x - C - HEFQAFMKNGKLF - C - PQDKKFFQSLDGIMF INK - C - AT - C - R 2 
Rj - C - DDFKKGERDGDF I - C - PDYYEAVCGTDGKTYDNR - C - AL - C - R a 
R- - C - SAFRPFVRNGRLG - C - TREND PVLGPDGKTHGNK -C-AM-C-R 2 
Rj - C - KE YEKQ VRNGRLF - C - TRESDP VRGPDGRMHGNK - C - AL - C - R 2 
R x - C - SQYQNQAKNGI LF - C - TREND P I RGPDGKMHGNL - C - SM - C - R 2 
Rj - C - NE YRKLVRNGKLA - C - TREND P I QGPDGKVHGNT - C - SM - C - R 2 
R 1 - C - S EYRKSRKNGRLF - C - TREND P I QGPDGKMHGNT - C - SM - C - R 2 
R x - C - S EFRDQVRNGTL I - C - TREHNP VRGPDGKMHGNK - C - AM - C - R 2 
R, - C - SE YRH YVRNGRLP - C - TRENDP I EGLDGKI HGNT -C-SM-C-R 2 
R x - C - DEFRRLLQNGKLF - C - TREND PVRG PDGKTHGNK - C - AM - C - R 2 
R, - C - AE YREQMKNGRLS - C - TRESDPVRDADGKS YNNQ - C - TM - C - R 2 
R x - O DE FRSQMKNGKL I - C - TRESDP VRGPDGKTHGNK -C-TM-C-R 2/ 

worin R ± NH 2 , eine Aminosaure oder ein Peptid mit bis 
zu 1.000 Aminosauren ist und R 2 COOH, CONH 2 , eine Amino- 
saure oder ein Peptid mit bis zu 1.000 Aminosauren ist. 

6. Serin-Proteinase-Inhibitor gemaS mindestens einem der 
Anspriiche 1 bis 5, dadurch gekennzeichnet , daS 

er zwischen dem ersten und dem vierten Cystein 
und/oder dem zweiten und dem dritten Cystein eine 
Disulf idbrucke aufweist oder 

er zwischen dem ersten und dem funften und/oder 
dem zweiten und dem vierten und/oder dem dritten 
und dem sechsten Cystein eine Disulf idbrucke 
aufweist. 
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7. Serin-Proteinase-Inhibitor gemaS mindestens einem der 
Anspriiche 1 bis 6, dadurch gekennzeichnet , da£ es 
sich um ein Fragment von VAKTI-1 (Seq. ID Nr. 1) oder 
VAKTI-2 (Seq. ID Nr. 2) handelt . 

8. Serin-Proteinase-Inhibitor gemaS Anspruch 7, dadurch 

i 

gekennzeichnet, daS es sich um HF 6479 (Seq. ID Nr. 3) 
oder HF 7665 (Seq. ID Nr. 4) handelt. 

9. Nucleinsaure, kodierend fur einen Serin-Proteinase-In- 
hibitor gemais mindestens einem der Anspriiche 1 bis 8. 

10. Arzneimittel enthaltend mindestens einen Serin-Pro- 
teinase-Inhibitor- gemaS mindestens einem der Anspriiche 
1 bis 8 und/oder eine Nucleinsaure gemaS Anspruch 9 
gegebenenf alls mit pharmazeut ischen Tragerstof f en . 

11. Arzneimittel nach Anspruch 10, enthaltend 0,01 bis 
1.000 mg/kg Korpergewicht des Serin- Proteinase-Inhibi- 
tors nach mindestens einem der Anspriiche 1 bis 8 
und/oder der Nucleinsaure gemaS Anspruch 9 . 

12. Verwendung des Serin-Proteinase-Inbibitors nach min- 
destens einem der Anspriiche 1 bis 8 zur Herstellung 
eines Arzneimittels zur Behandlung von akuten oder 
chronischen Cervixent ziindungen , Entziindungen der 
Bartholinschen Driisen und anderer vaginaler Bereiche, 
Tonsillitis, Pharyngitis und Laryngitis, mit exzessiver 
Schleimbildung verbundener akut oder chronisch entziind- 
licher Prozesse und sich daraus ergebender akuter Not- 
situationen, postoperat iver Blutungen aufgrund Hyper- 
fibrinolyse sowie zur Prophylaxe der Lungenemphysem- 
bildung bei of r Proteinase- Inhibi tormangel . 

13 . Verwendung der Nucleinsauren gemaE Anspruch 9 zur 
Herstellung eines- Arzneimittels zum Einsatz in der 
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Gentherapie zur Heilung und Prophylaxe von Erkrankungen 
gemaS Anspruch 12. 

14 . Antikorper oder Antikorper- Fragmente gegen Epitope der 
Verbindungen nach einem der Anspriiche 1 bis 8. 

i 

15. Poly* oder Oligonucleotide, die mit Bereichen der cDNA 
oder entsprechender RNA unter stringenten Bedingungen 
hybridisieren und gegebenenf alls die Expression 
codierender Bereiche der fur die Verbindungen nach 
Anspriichen 1 bis 8 codierenden Gene verhindern (Anti- 
sense Verbindungen) . 

16 . Diagnostikum enthaltend mindestens eine der Verbin- 
dungen gema£ Anspruch 14 oder 15 . 

17. Arzneimittel enthaltend mindestens eine der in den 
Anspruchen 14 und/oder 15 genannten Verbindungen in 
therapeutisch wirksamen Mengen . 

18. Verwendung der Verbindungen gemaS Anspruch 14 und/oder 
15 zur Herstellung eines Arzneimittels zur Behandlung 
von Erkrankungen, die mit einer zu hohen Expression der 
Verbindungen gemaS mindestens einem der Anspriiche 1 bis 
8 oder zu hohen Aktivitat der fur die Verbindungen 
gemaS Anspruchen 1 bis 8 codierenden Bereichen ver- 
bunden sind. 

19. DNA kodierend fur die in den Anspruchen 1 bis 8 genann- 
ten Verbindungen und/oder RNA, die in der Transcription 
oder Translation der in den Anspruchen 1 bis 8 genann- 
ten Verbindungen beteiligt ist. 

20. DNA gemaS Anspruch 19 mit der Seq. ID Nr. 5 oder Seq . 
ID Nr. 6 . 
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Figur 1 

VAKTI-1 cDNA und Translation in Aminosauresequenz 

Frame 2 M K I A 

ATG CAT GGA GTG GAC CTG TAG GCG ACT TGC ATC GTC TTC AAC ATG AAG ATA GCC 
10 19 28 37 46 55 



-MEMC-1- 



|->HF6479 

TVSVLLPLALCLIQDAASIKN 
ACA GTG TCA GTG CTT CTG CCC TTG GCT CTT TGC CTC ATA CAA GAT GCT GCC AGT AAG AAT 
64 73 82 91 100 109 



-MEMC-1 > CHEF-1- 



E DQEMCHE FQAFMKNGKLFC 
GAA GAT CAG GAA ATG TGC CAT GAA TTT CAG GCA TTT ATG AAA AAT GGA AAA CTG TTC TGT 
124 133 142 151 160 169 



-CHEF- 14 

-CHEF- 11 > < CHEF-2- 



PQDKKFFQSLDG.IMFINKCA 
CCC CAG GAT AAG AAA TTT TTT CAA AGT CTT GAT GGA ATA ATG TTC ATC AAT AAA TGT GCC 
184 193 202 211 220 229 

< CHEF-2 HF6479 < 1 

T C KM I I* E KE AK SQIKRA R H LA 
ACG TGC AAA ATG ATA CTG GAA AAA GAA GCA AAA TCA CAG AAG AGG GCC AGG CAT TTA GCA 
244 253 262 271 280 289 

RAPKATAPTELNCDDFKKGE 
AGA GCT CCC AAG GCT ACT GCC CCA ACA GAG CTG AAT TGT GAT GAT TTT AAA AAA GGA GAA 
304 313 322 331 340 349 

RDGDFICPDYYEAVCGTDGK 
AGA GAT GGG GAT TTT ATC TGT CCT GAT TAT TAT GAA GCT GTT TGT GGC ACA GAT GGG AAA 
364 373 382 391 400 409 

T YDNRCALCAENAKTGS QIG 
ACA TAT GAC AAC AGA TGT GCA CTG TGT GCT GAG AAT GCG AAA ACC GGG TCC CAA ATT GGT 
424 433 442 451 460 469 

VKSEGECKSSNPEQVRSIVS 



GTA AAA AGT GAA GGG GAA TGT AAG AGC AGT AAT CCA GAG CAG GTG AGG TCA ATT GTC AGC 
484 493 502 511 520 529 

LMGNTGRLTSNSK STOP 



CTG ATG GGA AAT ACT GGG AGG CTA ACT TCA AAT AGT AAG TAG GTG CTG TCC TCT TCC TTC 
544 553 562 571 580 589 



TTA GGT GGG AGC CTT GGA AGG AAT TAA TTC TTG CTT TAT GTG AAA TGG AAT ACC CAG TTA 
604 613 622 631 640 649 

CTG CCC ACT AAT ATG AAA AAG CTA ATT ATA GTC TCT GAA ACT GGA TCA GAT TAC TTT GGT 
664 673 682 691 700 709 



GGT TAA GAT CTT TCA ATC TAT TGC TGC TTT GTA T 
724 733 742 749 
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VAKTI-2 cDNA und Translation in Amino sauresequenz 

Frame 2 M K I A 

ATG CAT GGA GTG GAC CTG TAG GCG ACT TGC ATC GTC TTC AAC ATG AAG ATA GCC 
10 19 28 37 46 55 

| — > HF 647 

TV S V L L PLALC L I • Q D A A SIKN 
ACA GTG TCA GTG CTT CTG CCC TTG GCT CTT TGC CTC ATA CAA GAT GCT GCC AGT AAG AAT 
64 73 82 91 ( 100 109 

Repeat 1 



EDQEMCHEFQAFMKNGKLFC 
GAA GAT CAG GAA ATG TGC CAT GAA TTT CAG GCA TTT ATG AAA AAT GGA AAA CTG TTC TGT 

124 133 142 151 160 169 

# 

PQDKKFFQSLDGIMFINKCA 
CCC CAG GAT AAG AAA TTT TTT CAA AGT CTT GAT GGA ATA ATG TTC ATC AAT AAA TGT GCC 

184 193 202 211 220 229 



HF 647 9 < — i 



T C K M I L E K E A K S - Q i K R A R H L A 
ACG TGC AAA ATG ATA CTG GAA AAA GAA GCA AAA TCA CAG AAG AGG GCC AGG CAT TTA GCA 
244 253 262 271 280 289 

Typische Kazal-Domane 



R 

AG A 


A 

GCT 


P 

CCC 
304 


K 

AAG 


A 

GCT 


T 

ACT 
313 


A 

GCC 
# 


P 

CCA 


T 

ACA 
322 


E 

GAG 


L 

CTG 


N 

AAT 
331 


C 

TGT 


D 

GAT 


D 

GAT 
340 
+ 


F - 
TTT 


K 

AAA 


K 

AAA 
349 


G 

GGA 


£ 

GAA 


R 

AGA 


D 

GAT 

j 


G 

GGG 
364 


D 

GAT 


F 

TTT 


I 

ATC 
373 
ft ' 


C 

TGT 


P 

CCT 


D 

GAT 
382 


Y 

TAT 


Y 

TAT 


E 

GAA 
391 


A 

GCT 


V 

GTT 


C 

TGT 
400 


G 

GGC 


T 

ACA 


D 

GAT 
409 


G 

GGG 


K 

AAA 


T 

ACA 


y 

TAT 


D 

GAC 
424 


N 

AAC 


R 

AGA 


C 

TGT 
433 


A 

GCA 


L 

CTG 


C 

TGT 
442 


A 

GCT 


E 

GAG 


.N 

AAT 
451 


A 

GCG 


K 

AAA 


T 

ACC 
460 


G 

GGG 


S 

TCC 


Q 

CAA 
469 


I 

ATT 


G 

GGT 














+ 




















Repeat 2 

*- 




V 

GTA 


K 

AAA 


S 

AGT 
484 


E 

GAA 


G 

GGG 


E 

GAA 
493 


C 

TGT 


K 

AAG 


S 

AGC 
502 


S 

AGT 


N 

AAT 
# 


P 

CCA 
511 


E 

GAG 


Q 

CAG 


D 

GAT 
520 


V 

GTA 


C 

TGC 


S 

AGT 
529 


A 

GCT 


F 

TTT 


R 

CGG 


P 

CCC 


F 

TTT 
544 


V 

GTT 


R 

AGA 


N 

AAT 
553 


G 

GGA 


R 

AGA 


L 

CTT 
562 


G 

GGA 
u 


C 

TGC 


T 

ACA 
571 


R 

AGG 
+ 


GAA 


N 

AAT 
580 


D 

GAT 


P 

CCT 


V 

GTT 
589 


T 

CTT 


G 

GGT 


P 

CCT 


D 

GAT 


G 

GGG 
604 


K 

AAG 


T 

ACG 


H 

CAT 
613 


G 

GGC 


N 

AAT 


K 

AAG 
622 


c 

TGT 


A 

GCA 


M 

ATG 
631 


C 

TGT 


A 

GCT 


E 

GAG 
640 


L 

CTG 


F 

TTT 


L 

TTA 
649 


K 

AAA 


E 

GAA 


GCT 


E 

GAA 


N 

AAT 
664 


A 

GCC 


K 

AAG 


R 

CGA 
673 


E 

GAG 


G 

GGT 


GAA 
682 


T 

ACT 


R 

AGA 


t 

ATT 
691 


R 

CGA 


R 

CGA 


N 

AAT 
700 


A 

GCT 


E 

GAA 


K 

AAG 
709 


D 

GAT 


F 

TTT 


Repeat : 


3 
























# 












C 

TGC 


K 

AAG 


E 

GAA 
724 


Y 

TAT 


E 

GAA 


K 

AAA 
733 


Q 

CAA 


V 

GTG 


R 

AGA 
742 


N 

AAT 


G 

GGA 


R 

AGG 
751 


L 

CTT 


r 

TTT 
* 


C 

TGT 
7 60 


T ■ 
ACA 


R 

CGG 
+ 


E 

GAG 
769 


S 

AGT 


0 

GAT 


P 

CCA 


V 

GTC 


R 

CGT 
784 


G 

GGC 


? 

CCT 


D 

GAC 
793 


G 

GGC 


R 

AGG 


M * 

ATG 

302 


H 

CAT 


G 

GGC 


N 

AAC 
811 


K 

AA.A 


C 

TGT 


A 

GCC 
820 


L 

CTG 


C 

TGT 


A 

GCT 
829 


E 

GAA 


I 

ATT 


F 

TTC 


K 

AAG 


R 

CGG 
844 


R 

CGT 


c 


S 

TCA 
853 


E 

GAG 


r 

GAA 


M 

AAC 
862 


S 

AGT 


K 

AAA 


T 

ACA 
371 


D 

GAT 


Q 

CAA 


N 

AAT 
BSO 


L 

TTG 


G 

GGA 


K 

AAA 
889 


A 

GCT 


GAA 
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Repeat 4 

E KTKVKHEIVKL C S Q Y Q N Q A 
GAA AAA ACT AAA GTT AAA AGA GAA ATT GTG AAA CTC TGC AGT CAA TAT CAA AAT CAG GCA 
904 913 922 931 940 949 

a 

KNGILFCTRENDP IRG PDGK 
AAG AAT GGA ATA CTT TTC TGT ACC AGA GAA AAT GAC CCT ATT CGT GGT CCA GAT GGG AAA 

964 973 982 991 1000 1009 
# * 

MHGNLCSMCQVYFQAENEEK 
ATG CAT GGC AAC TTG TGT TCC ATG TGT CAA GTC TAC TTC CAA GCA GAA AAT GAA GAA AAG 
1024 1033 1042 1051 1060 1069 



| > HF 7665 

KKAEARARNKRIESGKATSYA 
AAA AAG GCT GAA GCA CGA GCT AGA AAC AAA AGA GAA TCT GGA AAA GCA ACC TCA TAT GCA 
1084 1093 1102 1111 1120 1129 

Repeat 5 

# 



E LCNEYRKLVRNGKLACTRE 
GAG CTT TGC AAT GAA TAT CGA AAG CTT GTG AGG AAC GGA AAA CTT GCT TGC ACC AGA GAG 
1144 1153 1162 1171 1180 1189 



N DPIQG.PDG.KVHGNTC SMCE 
AAC GAT CCT ATT CAG GGC CCA GAT GGG AAA GTG CAC GGC AAC ACC TGC TCC ATG TGT GAG 
1204 1213 1222 1231 1240 1249 

HF 7665 < 1 

V FFQAEEEEKKKKEGE S R N | K 
GTT TTT TTC CAA GCA GAA GAA GAA GAA AAG AAA AAG AAG GAA GGC GAA TCA AGA AAC AAA 
1264 1273 1282 1291 1300 1309 

Repeat 6 



RQSKSTASFEELCSEYRKSR 
AGA CAA TCT AAG AGT ACA GCT TCC TTT GAG GAG TTG TGT AGT GAA TAC CGC AAA TCC AGG 
1324 1333 1342 1351 1360 1369 



KMGRL FCTREN DP IQG PDGK 

AAA AAC GGA CGG CTT TTT TGC ACC AGA GAG AAT GAC CCC ATC CAG GGC CCA GAT GGG AAA 
1384 1393 1402 1411 1420 1429 

# * 

MHGNTCSMCEAFFQQEERAR 

ATG CAT GGC AAC ACC TGC TCC ATG TGT GAG GCC TTC TTT CAA CAA GAA GAA AGA GCA AGA 
1444 1453 1462 1471 1480 1489 

Repeat 7 



A KAKR EAAKEI CS E FR DQVR 
GCA AAG GCT AAA AGA GAA GCT GCA AAG GAA ATC TGC AGT GAA TTT CGG GAC CAA GTG AGG 

1504 1513 1522 1531 1540 1549 

# 

NGTLI CTREHN PVRGP DGKM 
AAT GGA ACA CTT ATA TGC ACC AGG GAG CAT AAT CCT GTC CGT GGA CCA GAT GGC AAA ATG 

1564 1573 1582 1591 1600 1609 



H GNKCAMCASV F K LEE EEKK 
CAT GGA AAC AAG TGT GCC ATG TGT GCC AGT GTG TTC AAA CTT GAA GAA GAA GAG AAG AAA 
1624 1633 1642 1651 1660 1669 

N DKEEKGKVEAEK'VKR EAVQ 
AAT GAT AAA GAA GAA AAA GGG AAA GTT GAG GCT GAA AAA GTT AAG AGA GAA GCA GTT CAG 
1684 1693 1702 1711 1720 1729 

Repeat 8 



E LCSEYRHYVRNGRLFCTRE 
GAG CTG TGC AGT GAA TAT CGT CAT TAT GTG AGG AAT GGA CGA CTC CCC TGT ACC AGA GAG 
1744 1753 1762 1771 1780 1789 
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g * 

NDPIEGLDGKIHGNTCSMCE 
AAT GAT CCT ATT GAG GGT CTA GAT GGG AAA ATC CAC GGC AAC ACC TGC TCC ATG TGT GAA 
1804 1813 1822 1831 1840 1849 



AFFQQEAKEKERAEPRAKVK 
GCC TTC TTC CAG CAA GAA GCA AAA GAA AAA GAA AGA GCT GAA CCC AGA GCA AAA GTC AAA 
1864 1873 1882 1891 1900 1909 

Repeat 9 



REAEKETCDEFRRLLQNGKL 
AGA GAA GCT GAA AAG GAG ACA TGC GAT GAA TTT CGG AGA CTT TTG CAA AAT GGA AAA CTT 
1924 1933 1942 1951 1960 1969 

# 

FCTR ENDPVRGPDGKTHGNK 
TTC TGC ACA AGA GAA AAT GAT CCT GTG CGT GGC CCA GAT GGC AAG ACC CAT GGC AAC AAG 
1984 1993 2002 2011 2020 2029 

# 

C A M C KAVFQKENEERKRKEE 
TGT GCC ATG TGT AAG GCA GTC TTC CAG AAA GAA AAT GAG GAA. AGA AAG AGG AAA GAA GAG 
2044 2053 2062 2071 2C80 2089 



E DQRNAAGH-GSSGGGGGNTQ 
GAA GAT CAG AGA AAT GCT GCA GGA CAT GGT TCC AGT GGT GGT GGA GGA GGA AAC ACT CAG 
2104 2113 2122 2131 2140 2149 

Repeat 10 

* . # 

DECAEYREQMKNGRLSCTRE 
GAC GAA TGT GCT GAG TAT CGG GAA CAA ATG AAA AAT GGA AGA CTC AGC TGT ACT CGG GAG 
2164 2173 2182 2191 2200 2209 

______# * 

SDPVRDADGKSYNNQCTMCK 
AGT GAT CCT GTA CGT GAT GCT GAT GGC AAA TCG TAC AAC AAT CAG TGT ACC ATG TGT AAA 
2224 2233 2242 2251 2260 2269 



AKLEREAERKNEYSRSRSNG 
GCA AAA TTG GAA AGA GAA GCA GAG AGA AAA AAT GAG TAT TCT CGC TCC AGA TCA AAT GGG 
2284 2293 2302 2311 2320 2329 

Repeat 11 



TGSESGKDTCDEFRSQMKNG 
ACT GGA TCA GAA TCA GGG AAG GAT ACA TGT GAT GAG TTT AGA AGC CAA ATG AAA AAT GGA 
2344 2353 2362 2371 2330 2389 



KLICTRESDPVRGPDGKTKG 
AAA CTT ATC TGC ACT CGA GAA AGT GAC CCT GTC CGG GGT CCA GAT GGC AAG ACA CAT GGT 
2404 2413 2422 2431 2440 2449 

ff * 



NKCTMCKEKLEREAAEKKRK 
AAT AAG TGT ACT ATG TGT AAG GAA AAA CTG GAA AGG GAA GCA GCT GAA AAA AAA AGA AAG 
2464 2473 2482 2491 2500 2509 



R M K T G A I Q £ K G A I Q I K G A M T 

AGG ATG AAG ACA GGA GCA ATA CAG GAG AAA GGA GCA ATA CAG GAG AAA GGA GCA ATG ACA 
252^ 2533 254: 2551 2360 2569 

K P. I C V V M F E A C R E M Z S L S A P 

AAG AGG ATC TGT GTC GTG AAT TTC GAA GCA TGC AGA GAA ATG GAA AGC TTA TCT GCA CCA 
25$~. 2593 2602 2611 2c"20 2629 
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£ k I T L F EAHMAR C T S I NV LC 

GAG AAA ATA ACC CTG TTC GAG GCC CAT ATG GCA AGA TGC ACA TCA ATA AAT GTG CTA TGT 
2644 2653 2662 2671 2680 2689 

VRASLIEKLMKEKRKMKRNQ 
GTC AGA GCA TCT TTG ATC GAG AAG CTA ATG AAA GAA AAA AGA AAG ATG AAG AGA AAT CAA 
2704 2713 2722 2731 2740 2749 

VAS PQIMQRMSA.VNFETI STOP 
GTA GCA AGC CCT CAA ATA ATG CAA AGG ATG AGT GCA GTG AAT TTC GAA ACT ATA TAA GGA 
2764 2773 2782 2791 , 2800 2809 



ACA ATG AAC TCA TCT GCC CTA GAG AGA ATG ACC CAG TGC ACG GTG CTG ATG GAA AGT TCT 
2824 2833 2842 2851 2860 2869 



ATA CAA ACA AGT GCT ACA TGT GCA GAG CTG TCT TTC TAA CAG AAG CTT TGG AAA GGG CAA 
2884 2893 2902 2911 2920 2929 



AGC TTC AAG AAA AAC CAT CCC ATG TTA GAG CTT CTC AAG AGG AAG ACA GCC CAG ACT CTT 
2944 2953 2962 2971 2980 2989 



TCA GTT CTC TGG ATT CTG AGA TGT GCA AAG ACT ACC GAG TAT TGC CCA GGA TAG GCT ATC 
3004 3013 3022 3031 3040 3049 



TTT GTC CAA AGG ATT TAA AGC CTG TCT GTG GTG ACG ATG GCC AAA CCT ACA ACA ATC CTT 
3064 3073 3082 3091 3100 3109 



GCA TGC TCT GTC ATG AAA ACC TGA TAC GCC AAA CAA ATA CAC ACA TCC GCA GTA CAG GGA 
3124 3133 3142 3151 3160 3169 



AGT GTG AGG AGA GCA GCA CCC CAG GAA CCA CCG CAG CCA GCA TGC CCC CGT TTG ACG AAT 
3184 3193 3202 3211 3220 3229 



GAC AGG AAG ATT GTT GAA AGC CAT GAG GGA AAA AAT AAA CCC CAG TTT TGA ATC ACC TAC 
3244 3253 3262 3271 3280 3289 



C^T CAC CAT CTG TAT ATA CAA AGA ATT TTT CGG AGC TTG TTT TAT TTG CTA TAG AAA ACA 
3304 3313 3322 3331 3340 3349 



ATA CAG AGC TTT TGG GAA TGG AAT CAC TGA TTT TCA GTC TTT TCC ATT TCT TTC CTC CTA 
3364 3373 3382 33'91 3400 3409 



GAA TCT GTG ATC TGA GGG TAT AAA GAC ATT TCC ACC AAG TTT GAG CCC TCA AAA TGT CCT 
3424 3433 3442 3451 3460 3469 

Pclyacieny lie rung ss igna 1 
GAT TAC AAT GCT GTC TGT CCA ACT GCC TGT TC A ATA AA A GTA AAC TCA GCA GAA AAA. . . . 
3484 3493 3502 3511 3520 3529 



Polv { A) -Tail 
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SEQUENZPROTOKOLL 



(1) ALLGEMEINE ANGABEN: 

(i) ANMELDER : 

(A) NAME: Prof. Dr. Wolf-Georg Forssmann 

(B) STRASSE: Feodor- Lynen-Str . 31 
CC) ORT: Hannover 

(E) LAND: Deutschland 

( F) POSTLEITZAHL : 3062 5 

(ii) BEZEICHNUNG DER ERFINDUNG : Serin-Proteinase - Inhibi toren 

(iii) ANZAHL DER SEQUENZEN: 34 

(iv) COMPUTER -LESBARE FAS SUNG : 

(A) DATSNTRAGER: Floppy disk 
<B) COMPUTER: IBM PC compatible 

(C) BETRIEBSSYSTEM: PC - DOS / MS - DOS 

(D) SOFTWARE: Patentln Release #1.0, Version #1.30 (EPA) 



(2) ANGABEN ZU SEQ ID NO : 1: 

( i ) SEQUENZ KENNZE I CHEN : 

(A) LANGE : 177 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORN: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 1: 

Met Lys lie Ala Thr Val Ser Val Leu Leu Pro Leu Ala Leu Cys Leu 
15 10 15 

lie Gin Asp Ala Ala Ser Lys Asn Glu Asp Gin Glu Met Cys His Glu 
20 25 30 

Phe Gin Ala Phe Met Lys Asn Gly Lys Leu Phe Cys Pro Gin Asp Lys 
35 40 45 

Lys Phe Phe Gin Ser Leu Asp Gly lie Met Phe lie Asn Lys Cys Ala 
50 55 60 

Thr Cys Lys Met lie Leu Glu Lys Glu Ala Lys Ser Gin Lys Arg Ala 
65 70 75 ' 80 

Arg His Leu Ala Arg Ala Pro Lys Ala Thr Ala Pro Thr Glu Leu Asn 
85 90 95 

Cys Asp Asp Phe Lys Lys Gly Glu Arg Asp Gly Asp Phe lie Cys Pro 
100 105 110 

Asp Tyr Tyr Glu Ala Val Cys Gly Thr Asp Gly Lys Thr Tyr Asp Asn 
115 120 125 

Arg Cys Ala Leu Cys Ala Glu Asn Ala Lys Thr Glv Ser Gin lie Gly 
130 135 140 

Val Lys Ser Glu Gly Glu Cys Lys Ser Ser Asn Pro Glu Gin Val Arg 
145 150 155 160 
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Ser lie Val Ser Leu Met Gly Asn Thr Gly Arg Leu Thr Ser Asn Ser 
165 170- ' 175 

Lys 



(2) ANGABEN ZU SEQ ID NO: 2: 

( i ) S EQUENZ KENNZ E ICHEN : 

(A) . LANGE: 922 Aminosauren 

(B) ART: Aminosaure 

(C) STRANG FORM : Einzel Strang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Pep t id 



(xi) SEQtJENZBESCHREIBUNG : SEQ ID NO; 2: 

Met Lys He Ala Thr Val Ser Val Leu Leu Pro Leu Ala Leu Cys Leu 
15 10 15 

He Gin Asp Ala Ala Ser Lys Asn Glu Asp Gin Glu Met Cys His Glu 
20 25 30 

Phe Gin Ala Phe Met Lys Asn" Gly Lys Leu Phe Cys Pro Gin Asp Lvs 
35 40 45 

Lys Phe Phe Gin Ser Leu Asp Gly He Met Phe He Asn Lys Cys Ala 
50 55 60 

Thr Cys Lys Met He Leu Glu Lys Glu Ala Lys Ser Gin Lys Arg Ala 
65 70 75 80 

Arg His Leu Ala Arg Ala Pro Lys Ala Thr Ala Pro Thr Glu Leu Asn 
85 90 95 

Cys Asp Asp Phe Lys Lys Gly Glu Arg Asp Gly Asp Phe He Cys Pro 
100 105 no 

Asp Tyr Tyr Glu Ala Val Cys Gly Thr Asp Gly Lys Thr Tyr Asp Asn 
115 120 125 

Arg Cys Ala Leu Cys Ala Glu Asn Ala Lys Thr Gly Ser Gin lie Gly 
130 135 140 

Val Lys Ser Glu Gly Glu Cys Lys Ser Ser Asn Pro Glu Gin Asp Val 
«5 150 155 160 

Cys Ser Ala Phe Arg Pro Phe Val Arg Asn Gly Arg Leu Gly Cys Thr 
165 170 175 

Arg Glu Asn Asp Pro Val Leu Gly Pro Asp Gly Lys Thr His Glv Asn 
180 185 190 

Lys Cys Ala Met Cys Ala Glu Leu Phe Leu Lys Glu Ala Glu Asn Ala 
195 200 205 

Lys Arg Glu Gly Glu Thr Arg He Arg Arg Asn Ala Glu Lys Asp Phe 
210 215 ■ 220 

Cys Lys Glu Tyr Glu Lys Gin Val Arg Asn Glv Arg Leu Phe Cys Thr 
225 230 235 ' 240 
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Arg Glu Ser Asp Pro Val Arg Gly Pro Asp Gly Arg Met His Gly Asn 
245 250 " ' " 255 

Lvs Cys Ala Leu Cys Ala Glu lie Phe Lys Arg Arg ?he Ser Glu Glu 
260 265 " 270 

Asn Ser Lys Thr Asp Gin Asn Leu Gly Lys Ala Glu Glu Lys Thr Lvs 
275 280 285 

Val Lys Arg Glu lie Val Lys Leu Cys Ser Gin Tyr Gin Asn Gin Ala 
290 295 300 

Lys Asn Gly lie Leu Phe Cys Thr Arg Glu Asn Asp Pro lie Arg Gly 
305 310 315 320 

Pro Asp Gly Lys Met Kis Gly Asn Leu Cys Ser Met Cys Gin Val Tyr 
325 330 335 

Phe Gin Ala Glu Asn Glu Glu Lys Lys Lys Ala Glu Ala Arg Ala Arg 
340 345 350 

Asn Lys Arg Glu Ser Gly Lys Ala Thr Ser Tyr Ala Glu Leu Cys Asn 
355 360 365 

Glu Tyr Arg Lys Leu Val Arg Asn Gly Lys Leu Ala Cys Thr Arg Glu 
370 375 380 

Asn Asp Pro lie Gin Gly Pro Asp Gly Lys Val His Gly Asn Thr Cys 
385 390 395 400 

Ser Met Cys Glu Val Phe Phe Gin Ala Glu Glu Glu Glu Lys Lys Lys 
405 410 415 

Lys Glu Gly Glu Ser Arg Asn Lys Arg Gin Ser Lys Ser Thr Ala Ser 
420 425 430 

Phe Glu Glu Leu Cys Ser Glu Tyr Arg Lys Ser Arg Lys Asn Gly Arg 
435 440 445 

Leu Phe Cys Thr Arg Glu Asn Asp Pro lie Gin Gly Pro Asp Gly Lys 
450 455 460 

Met His Gly Asn Thr Cys Ser Met Cys Glu Ala Phe Phe Gin Gin Glu 
465 470 475 480 

Glu Arg Ala Arg Ala Lys Ala Lys Arg Glu Ala Ala Lys Glu lie Cys 
485 490 495 

Ser Glu Phe Arg Asp Gin Val Arg Asn Gly Thr Leu lie Cys Thr Arg 
500 505 510 

Glu His Asn Pro Val Arg Gly Pro Asp Gly Lys Met His Gly Asn Lvs 
515 520 " 525 

Cys Ala Met Cys Ala Ser Val Phe Lys Leu Glu Glu Glu Glu Lys Lvs 
530 ' 535 540 

Asn Asp Lys Glu Glu Lys Gly Lys Val Glu Ala Glu Lys Val Lys Arg 
545 550 555 560 

Glu Ala Val Gin Glu Leu Cys Ser Glu Tyr Arg His Tyr Val Arg Asn 
565 570 ^ 575 

Gly Arg Leu Pro Cys Thr Arg Glu Asn Asp Pro lie Glu Glv Leu Asp 
580 585 590 
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Gly Lys lie His Gly Asn Thr Cys Ser Met. Cys Glu Ala Phe Phe Gin 
595 600 605 

Gin Glu Ala Lys Glu Lys Glu Arg Ala Glu Pro Arg Ala Lys Val Lys 
biu 61 5 620 

Arg Glu Ala Glu Lys Glu Thr Cys Asp Glu Phe Arg Arg Leu Leu Gin 
625 530 635 640 

Asn Gly Lys Leu Phe Cys Thr Arg Glu Asn Asp Pro Val Arg Gly Pro 
645 650 6 55 

Asp Gly Lys Thr His Gly Asn Lys Cys Ala Aet Cys Lys Ala Val Phe 
660 665 670 

Gin Lys Glu Asn Glu Glu Arg Lys Arg Lys Glu Glu Glu Asp Gin Arq 
675 680 685 ^ y 

Asn Ala Ala Gly His Gly Ser Ser Gly Gly Gly Gly Gly Asn Thr Gin 
690 695 700 

Asp Glu Cys Ala Glu Tyr Arg Glu Gin Met Lys Asn Gly Arg Leu Ser 
705 710 715 720 

Cys Thr Arg Glu Ser Asp Pro Val Arg Asp Ala Asp Gly Lys Ser Tyr 
725 730 735 

Asn Asn Gin Cys Thr Met Cys Lys Ala Lys Leu Glu Arg Glu Ala Glu 
•740 745 ?50 

Arg Lys Asn Glu Tyr Ser Arg Ser Arg Ser Asn Gly Thr Gly Ser Glu 
755 760 765 



Ser 


Gly Lys 
770 


Asp 


Thr 


Cys 


Asp 
775 


Glu 


Phe 


Arg 


Ser 


Gin 
780 


Met 


Lys 


Asn 


Gly 


Lys 
785 


Leu 


lie 


Cys 


Thr 


Arg 
790 


Glu 


Ser 


Asp 


Pro 


Val 
795 


Arg Gly 


Pro 


Asp Gly 
800 


Lys 


Thr 


His 


Gly Asn 
805 


Lys 


Cys 


Thr 


Met 


Cys 
810 


Lys 


Glu 


Lys 


Leu 


Glu 
815 


Arg 


Glu 


Ala 


Ala 


Glu 
820 


Lys 


Lys 


Arg 


Lys 


Arg 
825 


Met 


Lys 


Thr 


Gly Ala 
830 


He 


Gin 


Glu 


Lys 


Gly Ala 
835 


He 


Gin 


Glu 


Lys 
840 


Gly Ala 


Met 


Thr 


Lys 
845 


Arg 


He 


Cys 


Val 


Val 
850 


Asn 


Phe 


Glu 


Ala 


Cys 
855 


Arg 


Glu 


Met 


Glu 


Ser 
860 


Leu 


Ser 


Ala 


Pro 


Glu 
865 


Lys 


He 


Thr 


Leu 


Phe 
870 


Glu 


Ala 


His 


Met 


Ala 
875 


Arg 


Cys 


Thr 


Ser 


He 
880 


Asn 


Val 


Leu 


Cys 


Val 
885 


Arg 


Ala 


Ser 


Leu 


He 
890 


Glu 


Lys 


Leu 


Met 


Lys 
895 


Glu 


Lys 


Arg 


Lys 


Met 
900 


Lys 


Arg 


Asn 


Gin 


Val 
905 


Ala 


Ser 


Pro 


Gin 


He 
910 


Met 


Gin 



Arg Met Ser Ala Val Asn Phe Glu Thr He 
915 920 
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(2) ANGABEN ZU SEQ ID NO: 3: 

{ i ) S EQUENZ KENNZE I CHEN : 

{A) LANGE: 55 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



Cxi) SEQUENZBESCHREIBUNG: SEQ ID NO : 3: 

Lys Asn Glu Asp Gin Glu Met Cys His Glu Phe Gin Ala Phe Met Lvs 
1 5 10 15 

Asn Gly Lys Leu Phe Cys Pro Gin Asp Lys Lys Phe Phe Gin Ser Leu 
20 25 30 

Asp Gly lie Met Phe lie Asn Lys Cys Ala Thr Cys Lys Met lie Leu 
35 40 45 

Glu Lys Glu Ala Lys Ser Gin 
50 55 

(2) ANGABEN ZU SEQ ID NO: 4: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 68 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 4: 

Glu Ser Gly Lys Ala Thr Ser Tyr Ala Glu Leu Cys Asn Glu Tyr Arg 
15 10 15 

Lys Leu Val Arg Asn Gly Lys Leu Ala Cys Thr Arg Glu Asn Asp Pro 
20 25 30 

lie Gin Gly Pro Asp Gly Lys Val His Gly Asn Thr Cys Ser Met Cys 
35 40 45 

Glu Val Phe Phe Gin Ala Glu Glu Glu Glu Lys Lys Lys Lys Glu Gly 
50 55 60 

Glu Ser Arg Asn 
65 

(2) ANGABEN ZU SEQ ID NO: 5: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 748 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 



(ii) ART DES MOLEKULS: 



cDNA 
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fxi) SEQUENZBESCHREIBUNG : SEQ ID NO: 5: 

ATGCATGGAG TGGACCTGTA GGCGACTTGC ATCGTCTTCA ACATGAAGAT AGCCACAGTG 60 

TCAGTGCTTC TGCCCTTGGC TCTTTGCCTC ATACAAGATG CTGCCAGTAA GAATGAAGAT 120 

CAGGAAATGT GCCATGAATT TCAGGCATTT ATGAAAAATG GAAAACTGTT CTGTCCCCAG 180 

GATAAGAAAT TTTTTCAAAG TCTTGATGGA ATAATGTTCA TCAATAAATG TGCCACGTGC 24 0 

AAAATGATAC TGGAAAAAGA AGCAAAATCA CAGAAGAGGG CCAGGCATTT AGCAAGAGCT 3 00 

CCCAAGGCTA CTGCCCCAAC AGAGCTGAAT TGTGATGATT TTAAAAAAGG AGAAAGAGAT 3 60 

GGGGATTTTA TCTGTCCTGA TTATTATGAA GCTGTTTGTG GCACAGATGG GAAAACATAT 420 

GACAACAGAT GTGCACTGTG TGCTGAGAAT GCGAAAACCG GGTCCCAAAT TGGTGTAAAA 4 80 

AGTGAAGGGG AATGTAAGAG CAGTAATCCA GAGCAGGTGA GGTCAATTGT CAGCCTGATG 54 0 

GGAAATACTG GGAGGCTAAC TTCAAATAGT AAGTAGGTGC TGTCCTCTTC CTTCTTAGGT 6 00 

GGGAGCCTTG GAAGGAATTA ATTCTTGCTT TATGTGAAAT GGAATACCCA GTTACTGCCC 6 60 

ACTAATATGA AAAAGCTAAT TATAGTCTCT GAAACTGGAT CAGATTACTT TGGTGGTTAA 720 

GATCTTTCAA TCTATTGCTG CTTTGTAT 74 8 
(2) ANGABEN ZV SEQ ID NO: 6: 

( i ) S EQUENZKENNZE I CHEN : 

(A) LANGE: 3531 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : CDNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 6: 



ATGCATGGAG 


TGGACCTGTA 


GGCGACTTGC 


ATCGTCTTCA 


ACATGAAGAT 


AGCCACAGTG 


60 


TCAGTGCTTC 


TGCCCTTGGC 


TCTTTGCCTC 


ATACAAGATG 


CTGCCAGTAA 


GAATGAAGAT 


120 


CAGGAAATGT 


GCCATGAATT 


TCAGGCATTT 


ATGAAAAATG 


GAAAACTGTT 


CTGTCCCCAG 


180 


GATAAGAAAT 


TTTTTCAAAG 


TCTTGATGGA 


ATAATGTTCA 


TCAATAAATG 


TGCCACGTGC 


240 


AAAATGATAC 


TGGAAAAAGA 


AGCAAAATCA 


CAGAAGAGGG 


CCAGGCATTT 


AGCAAGAGCT 


300 


CCCAAGGCTA 


CTGCCCCAAC 


AGAGCTGAAT 


TGTGATGATT 


TTAAAAAAGG 


AGAAAGAGAT 


360 


GGGGATTTTA 


TCTGTCCTGA 


TTATTATGAA 


GCTGTTTGTG 


GCACAGATGG 


GAAAACATAT 


420 


GACAACAGAT 


GTGCACTGTG 


TGCTGAGAAT 


GCGAAAACCG 


GGTCCCAAAT 


TGGTGTAAAA 


480 


AGTGAAGGGG 


AATGTAAGAG 


CAGTAATCCA 


GAGCAGGATG 


TATGCAGTGC 


TTTTCGGCCC 


540 


TTTGTTAGAA 


ATGGAAGACT 


TGGATGCACA 


AGGGAAAATG 


ATCCTGTTCT 


TGGTCCTGAT 


600 


GGGAA.GACGC 


ATGGCAATAA 


GTGTGCAATG 


TGTGCTGAGC 


TGTTTTTAAA 


AGAAGCTGAA 


660 
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AATGCCAAGC 


GAGAGGGTGA 


AACTAGAATT 


CGACGAAATG 


CTGAAAAGGA- 


TTTTTGCAAG 


720 


GAATATGAAA 


AACAAGTGAG 


AAATGGAAGG 


CTTTTTTGTA 


CACGGGAGAG 


TGATCCAGTC 


780 


CGTGGCCCTG 


ACGGCAGGAT 


GCATGGCAAC 


AAATGTGCCC 


TGTGTGCTGA 


AATTTTCAAG 

X X X X WiUiVj 


84 0 


CGGCGTTTTT 


CAGAGGAAAA 


CAGTAAAACA 


GATCAAAATT 


TGGGAAAAGC 


TGAAGAAAAA 




ACTAAAGTTA 


AAAGAGAAAT 


TGTGAAACTC 


TGCAGTCAAT 


ATC AAAAT P A 


GGP A A AG A AT 


-7 D VJ 


GGAATACTTT 


TCTGTACCAG 


AGAAAATGAC 


CCTATTCGTG 


GTCCAGATGG 


GAAA ATPPAT 




GGCAACTTGT 


GTTCCATGTG 


TCAAGTCTAC 


TTCCAAGCAG 


AAAAtG AAG A 


AAAPAAAAAP 


i nan 

x, U O U 


GCTG AAG C AC 


GAGCTAGAAA 


CAAAAGAGAA 


TCTGGAAAAG 


C AACCTPATA 


TPP AP APPTT 


i i /in 


TG CAATGAAT 


ATCGAAAGCT 


TGTGAGGAAC 


GGAAAACTTG 


CTTGCACCAG 


AGAGAAPPAT 


-L U (J 


CCTATTCAGG 


GCCCAGATGG 


GAAAGTGCAC 


GGCAACACCT 


GCTCCATGTG 


TGAGGTTTTT 
x w^ivjvj x x x x x 




TTCCAAGCAG 


AAGAAGAAGA 


AAAGAAAAAG 


AAGGAAGGCG 


AATCAAGAAA 


PA A A AG AP A A 


i i> o n 


TCTAAGA.GTA 


CAGCTTCCTT 


TGAGGAGTTG 


TGTAGTGAAT 


ACCGCAAATC 


PAGGAA A AAP 


i -ion 

x, J O \J 


GG ACGGCTTT 


TTTGCACCAG 


AGAGAATGAC 


CCCATCCAGG 


G C CCAGATGG 


GAAAATPPAT 


144 0 
J. *± 'i \J 


GGCAAPAPPT 


GCTCCATGTG 


TGAGGCCTTC 


TTTCAAPAAG 


AAGAAAP-APP 


A AP; A PP A Z\ i\ P 




GCTAAAAGAG 


AAGCTGCAAA 


GGAAATCTGC 


AGTGAATTTC 

**vj x vjiirx x. x x v-» 


GGGAPPAAGT 


GAGGAATPPA 


X JOu 


ACACTTATAT 


GCACCAGGGA 


GCATAATCCT 


GTCCGTGGAC 


CAGATGGPAA 


AATGPATGGA 


162 0 


AACAAGTGTG 


CCATGTGTGC 


CAGTGTGTTG 


AAACTTGAAG 


AAGAAGAGAA 


GAAAAATGAT 


X D O \J 


AAAGAAGAAA 


AAGGG A AAGT 


TGAGGPTGAA 


AAAGTTAAGA 


PAG A AGP APT 


TPAPPAPPTP 


1 *7 A O 


TG C AGTG AAT 


ATCGTCATTA 


TGTGAGGAAT 


GGACGACTCP 


PCTGTAPPAG 


AGAGAATGAT 


1 POO 
x o v yj 


CPTATTG AGG 


GTPTAGATGG 


G AAAATC GAG 


GGCAAPAPPT 


PPTPPATPTP 


TPA APPPTTP 


J_ O D U 


TTPPAGPAAG 


A AGPA AAAGA 


AAAAGAAAGA 


GPTGAAPPPA 


GAGPA A A APT 


PAAAAPAPAA 


1 Q 9 O 


GPTGAAAAGG 


AGAPATPPPA 


TGAATTTPGG 


AGAPTTTTPP 

A\Jri\ — X X X X v3 \_. 


A A AATHHA A A 


A PT'TT'TPTPP 

jrlV, X X X X V- X 


XjOU 


ACAAGAGAAA 


ATGATCCTGT 


GCGTGGCCCA 


G ATGG G AAG A 


CCCATGGPAA 


PAAGTGTGPP 


2 04 0 


ATGTGTAAGG 


CAGTCTTCCA 


GAAAGAAAAT 


GAGGAAAGAA 


AGAGGAAAGA 


AG AGG A AG AT 


2100 


CAGAGAA ATG 


CTGCAGGACA 


TGGTTCCAGT 


GGTGGTGGAG 


GAGGAAACAC 


T C A G G AC G AA 


2160 


TGTGCTGAGT 


ATCGGGAACA 


AATGAAAAAT 


GGAAGACTCA 


GCTGTACTPG 


GGAGAGTGAT 


22 2 0 


CCTGTACGTG 


ATGCTGATGG 


CAAATCGTAC 


AACAATCAGT 


GTAPPATGTG 


TAAAGPAAAA 


22 80 


TTGGAAAGAG 


AAGC A GAG AG 


AAAAAATGAG 


TATTCTCGCT 


PP AG ATP A A A 


TGPGAPTPGA 


9^4 0 


TCAGAATrAG 


GGAAGG AT AG 


ATGTGATGAG 


TTTAGAAGCC 


AAATGAAAAA 


TGG A A A A PTT 


94 00 
i u \j 


ATCTGCACTC 


GAGAAAGTGA 


CCCTGTCCGG 


GGTCCAGATG 


GC AAG AC AC A 


TGGTAATAAG 


2460 


TGTACTATGT 


GTAAGGAAAA 


ACTGGAAAGG 


GAAGCAGCTG 


AAAAAAAAAG 


AAAGAGGATG 


2520 


AAGACAGGAG 


C AAT AC AG G A 


GAAAGGAGCA 


ATACAGGAGA 


AAGGAGCAAT 


GACAAAGAGG 


2580 


ATCTGTGTCG 


TGAATTTCGA 


AG C ATG C AG A 


GAAATGGAAA 


GCTTATCTGC 


ACCAGAGAAA 


2640 


ATAACCCTGT 


TCGAGGCCCA 


TATGGCAAGA 


TGCACATCAA 


TAAA.TGTGCT 


ATGTGTCAGA 


2700 
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G C ATCTTTG A 


TCGAGAAGCT 


AATGAAAGAA 


AAAAGAAAGA 


TGAAGAGAAA 


TCAAGTAGCA 


2760 


AGCCCTCAAA 


TAATGCAAAG 


GATGAGTGCA 


GTGAATTTCG 


AAACTATATA AGGAACAATG 


2820 


AACTCATCTG 


GCCTAGAGAG 


AATGACCCAG 


TGCACGGTGC 




1 i v — L /i I 


2880 


ACAAGTGCTA 


CATGTGCAGA 


GCTGTCTTTC 


TAACAGAAGC 


TTTH^ a A APP 


ppn a fl^T , T"T , ^ , 


2940 


AAGAAAAACC 


ATCCCATGTT 


AGAGCTTCTC 


AAGAGGAAGA 


p a p p p p n p a p 


TPTTTr 1 A /"* • i •* p 

J. I (~ A<j I I 


3000 


CTCTGGATTC 


TGAGATGTGC 


AAAGACTACC 


GAGTATTGCC 


papp 21 T* a PPP 




3060 


CAAAGGATTT 


AAAGCCTGTC 


TGTGGTGACG 


ATGGCCAAAC 


PT A.^7A7\r" , 7\A r r 




3120 


TCTGTCATGA 


AAACCTGATA 


CGCCAAACAA 


ATACACACAT 


r** r~* i\ t 1 7\ 7\ 
L. ALi I AL A 


GGGAAGTGTG 


3180 


AGGAGAGCAG 


CACCCCAGGA 


ACCACCGCAG 


CCAGCATGCC 


CCCGTTTGAC 


GAATGACAGG 


3240 


AAGATTGTTG 


AAAGCCATGA 


GGGAAAAAAT 


AAACCCCAGT 


TTTGAATCAG 


CTACCTTCAC 


3300 


CATCTGTATA 


TACAAAGAAT 


TTTTCGGAGC 


TTGTTTTATT 


TGCTATAGAA 


AACAATACAG 


3360 


AGCTTTTGGG 


AATGGAATCA 


CTGATTTTCA 


GTCTTTTCCA 


TTTCTTTCCT 


CCTAGAATCT 


3420 


GTGATCTGAG 


GGTATAAAGA 


CATTTCCACC 


AAGTTTGAGC 


CCTCAAAATG 


TCCTGATTAC 


3480 


AATGCTGTCT 


GTCCAACTGC 


CTGTTCAATA 


AAAGTAAACT 


GAGCAGAAAA 


A 


3531 


(2) ANGABEN ZU SEQ ID 


NO : 7 : 











( i ) S EQUENZ KENNZE I CHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANG FORM : Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 7: 

His Glu Phe Gin Ala Phe Met Lys Asn Gly Lys Leu Phe 
15 10 

(2) ANGABEN ZU SEQ ID NO: 8: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART -. Aminosaure 

(C) STRANG FORM : Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 

(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 8: 

Ser Glu Tyr Arg Lys Ser Arg Lys Asn Gly Arg Leu Phe 
1 5* * 10* 



WO 99/33974 



9 



PCT/EP98/08424 



(2) ANGABEN ZU SEQ ID NO: 9: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANG FORM : Einzel Strang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Pep t id 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 9: 

Asp Asp Phe Lys Lys Gly Glu Arg Asp Gly Asp Phe lie 
15 10 

(2) ANGABEN ZU SEQ ID NO: 10: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 13 Aminosauren 
(3) ART: Aminosaure 

(C) STRANG FORM : Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 10: 

Ser Glu Phe Arg Asp Gin Val Arg Asn Gly Thr Leu lie 
15 10 

(2) ANGABEN ZU SEQ ID NO: 11: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANG FORM : Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 11: 

Ser Ala Phe Arg Pro Phe Val Arg Asn Gly Arg Leu Gly 
15 10 

(2) ANGABEN ZU SEQ ID NO: 12: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE : 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 12: 

Ser GIu Tyr Arg His Tyr Val Arg Asn Gly Arg Leu Pro 
15 10 

(2) ANGABEN ZU SEQ ID NO: 13: 

( i } S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 13 Aminosauren 
(3). ART: Aminosaure 

(C) STRANG FORM : Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

i 

(ii) ART DES MOLEKULS : Pep t id 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 13: 

Lys GIu Tyr Glu Lys Gin Val Arg Asn Gly Arg Leu Phe 
15 10 

(2) ANGABEN ZU SEQ ID NO: 14: 

{ i ) S EQUENZKENNZE I CHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANG FORM : Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 14: 

Asp Glu Phe Arg Arg Leu Leu Gin Asn Gly Lys Leu Phe 
15 10 

(2) ANGABEN ZU SEQ ID NO: 15: 

{ i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 13 Aminosauren 
tS) ART: Aminosaure 

(C) STRANG FORM : Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 15: 

Ser Gin Tyr Gin Asn Gin Ala Lys Asn Gly lie Leu Phe 
15 10 

(2) ANGABEN ZU SEQ ID NO: 16: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 13 Aminosauren 
{ B) ART: Aminosaure 
[C] STRANG FORM : Einzelstrang 
i D) TOPOLOGIE: nicht bekannt 



WO 99/33974 

(ii) ART DES MOLEKULS: 
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Pepcid 
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(xi) SEQUENZ3ESCHREIBUNG: SEQ ID NO: 16: 

Ala Glu Tyr Arg Glu Gin Met Lys Asn Gly Arg Leu Ser 
1-5 10 

(2) ANGABEN ZU SEQ ID NO: 17: 

(i) SEQUENZKENNZEICHEN: 1 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzel Strang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Pepcid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 17: 

Asn Glu Tyr Arg Lys Leu Val Arg Asn Gly Lys Leu Ala 
1 5 10 

(2) ANGABEN ZU SEQ ID NO: 18: 

( i ) S EQUENZKENNZ EI CHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 18: 

Asp Glu Phe Arg Ser Gin Met Lys Asn Gly Lys Leu lie 
1 5 10 

(2) ANGABEN ZU SEQ ID NO : 19: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 18 Aminosauren 
(3) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE : nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 19: 

Pro Gin Asp Lys Lys Phe Phe Gin Ser Leu A.sp Gly He Met Phe He 
1 5 s 10 15 

Asn Lys 



WO 99/33974 



12 



PCT/EP98/08424 



(2) ANGABEN ZU SEQ ID NO: 20: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM : Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 20: 



Thr Arg Glu Asn Asp Pro lie Gin Gly Pro Asp Gly Lys Met His Gly 
15 10 15 

Asn Thr 



(2) ANGABEN ZU SEQ ID NO: 21: 

(i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 21: 

Thr Arg Glu Asn Asp Pro Val Leu Gly Pro Asp Gly Lys Thr His Gly 
15 10 15 

Asn Lys 

(2) ANGABEN ZU SEQ ID NO: 22: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(Xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 22: 

Thr Arg Glu His Asn Pro Val Arg Gly Pro Asp Gly Lys Met His Gly 
1 5 10 ~ ' . 15 

Asn Lys 



WO 99/33974 
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(2) ANGABEN ZU SEQ ID NO: 23: 

( i) SEQUENZKENNZEICHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO : 23: 



Thr Arg Glu Ser Asp Pro Val Arg Gly Pro Asp Gly Arg Met His Gly 
15 10 is- 

Asn Lys 

(2) ANGABEN ZU SEQ ID NO: 24: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 18 Aminos auren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 24: 

Thr Arg Glu Asn Asp Pro lie Glu Gly Leu Asp Gly Lys lie His Gly 
15 10 15 

Asn Thr 



(2) ANGABEN ZU SEQ ID NO: 25: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: . 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 25: 

Thr Arg Glu Asn Asp Pro He Arg Gly Pro Asp Gly Lys Met His Gly 

1 5 10 15 

Asn Leu 
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(2) ANGABEN ZU SEQ ID NO: 26: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANG FORM : Einzels trang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Peptid 



(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 26: 

Thr Arg Glu Asn Asp Pro Val Arg Gly Pro Asp Gly Lys Thr His Gly 
15 10 15 

Asn Lys 



(2) ANGABEN ZU SEQ ID NO: 27: 

C i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 18 Aminosauren 

( B ) ART : Aminosaure 

(C) STRANG FORM : Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 27: 

Thr Arg Glu Asn Asp Pro lie Gin Gly Pro Asp Gly Lys Val His Gly 

15 10 15 

Asn Thr 



2) ANGABEN ZU SEQ ID NO: 28: 

( i ) S EQUENZKENNZE I CHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) S TRANG FORM : Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 28: 

Thr Arg Glu Ser Asp Pro Val Arg Asp Ala Asp Gly Lys Ser .Tyr Asn 
1 5 " • 10 15 

Asn Gin 
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(2) ANGA3EN ZU SEQ ID NO : 29: 

{ i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART; Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Pepcid 



<xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 29: 

Thr Arg Glu Ser Asp Pro Val Arg Gly Pro Asp Gly Lys Thr His Gly 

15 io 15 

Asn Lys 



(2) ANGABEN ZU SEQ ID NO: 30: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 2 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 30: 

Ala Thr 
1 

(2) ANGABEN ZU SEQ ID NO : 31: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 2 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 31: 

Ala Leu 
1 

(2) ANGABEN ZU SEQ ID NO: 32: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 2 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht ^bekannt 

(ii) ART DES MOLEKULS: Peptid 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 32: 

Ala Met 
1 

(2) ANGABEN ZU SEQ ID NO: 33: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 2 Aminosauren 

(B) ART: Aminosaure 

(C) STRANG FORM : Einzel Strang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 33: 
Ser Met 



2) ANGABEN ZU SEQ ID NO: 34: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 2 Aminosauren 

(B) ART: Aminosaure 

(C) STRANG FORM : Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 34: 

Thr Met 
1 
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